期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 不平衡多分类算法综述
李蒙蒙, 刘艺, 李庚松, 郑奇斌, 秦伟, 任小广
《计算机应用》唯一官方网站    2022, 42 (11): 3307-3321.   DOI: 10.11772/j.issn.1001-9081.2021122060
摘要843)   HTML91)    PDF (1861KB)(599)    收藏

不平衡数据分类是机器学习领域的重要研究内容,但现有的不平衡分类算法通常针对不平衡二分类问题,关于不平衡多分类的研究相对较少。然而实际应用中的数据集通常具有多类别且数据分布具有不平衡性,而类别的多样性进一步加剧了不平衡数据的分类难度,因此不平衡多分类问题已经成为亟待解决的研究课题。针对近年来提出的不平衡多分类算法展开综述,根据是否采用分解策略把不平衡多分类算法分为分解方法和即席方法,并进一步将分解方法按照分解策略的不同划分为“一对一(OVO)”架构和“一对多(OVA)”架构,将即席方法按照处理技术的不同分为数据级方法、算法级方法、代价敏感方法、集成方法和基于深度网络的方法。系统阐述各类方法的优缺点及其代表性算法,总结概括不平衡多分类方法的评价指标,并通过实验深入分析代表性方法的性能,讨论了不平衡多分类的未来发展方向。

图表 | 参考文献 | 相关文章 | 多维度评价
2. 结合局部敏感哈希的 k近邻数据填补算法
郑奇斌, 刁兴春, 曹建军, 周星, 许永平
计算机应用    2016, 36 (2): 397-401.   DOI: 10.11772/j.issn.1001-9081.2016.02.0397
摘要555)      PDF (814KB)(969)    收藏
k近邻( kNN)算法是缺失数据填补的常用算法,但由于需要逐个计算所有记录对之间的相似度,因此其填补耗时较高。为提高算法效率,提出结合局部敏感哈希(LSH)的 kNN数据填补算法LSH- kNN。首先,对不存在缺失的完整记录进行局部敏感哈希,为之后查找近似最近邻提供索引;其次,针对枚举型、数值型以及混合型缺失数据分别提出对应的局部敏感哈希方法,对每一条待填补的不完整记录进行局部敏感哈希,按得到的哈希值找到与其疑似相似的候选记录;最后在候选记录中通过逐个计算相似度来找到其中相似程度最高的 k条记录,并按照 kNN算法对不完整记录进行填补。通过在4个真实数据集上的实验表明,结合局部敏感哈希的 kNN填补算法LSH- kNN相对经典的 kNN算法能够显著提高填补效率,并且保持准确性基本不变。
参考文献 | 相关文章 | 多维度评价
3. 无人系统数据融合流水线架构设计WISA2023+171
刘艺 杨国利 郑奇斌 李翔 周扬森 陈德鹏